Stable Diffusion进阶篇：AnimateDiff 动画插件2

[ 首页 ] > 栏目[ StableDiffusion ] > 文章[ Stable Diffusion进阶篇：AnimateDiff 动画插件2 ] 发布时间: 2024-03-06 编号: 41325

（请先看上一篇AnimateDiff的内容，本篇是进阶参数学习）

在上篇笔记中学习了一下什么是AnimateDiff（以下简称AD）以及其简单的操作流程，至少看完上篇笔记之后就可以简单制作出一个小动画了。

虽然只是一个比较短的动画，但是至少理解了AD的运作原理，那就是一张张图片进行重绘然后再拼接起来形成一个动图。

不过上节课没有学到的是关于AD的其他参数：

《（Stable Diffusion进阶篇：AnimateDiff 动画插件2）》- 投稿作者:简历白纸一张 - 发布于:GetAI社区

所以今天的文章就来简单学习一下AD的参数都是用来干什么的。

首先最为基础也是最为核心的就是运动模型，也是上篇笔记中提到的运动模块。AD的开发者们针对Stable Diffusion1.5一共训练过三代模型，分别用V1、V2、V3来表示。

就目前来看V3的模型是最新也是训练得最先进的，其出图的运动会更加流畅自然，老版本的问题则在于生成图片的时候可能会出现水印，比较影响观感。

《（Stable Diffusion进阶篇：AnimateDiff 动画插件2）》- 投稿作者:简历白纸一张 - 发布于:GetAI社区

不过AI的生成是具有一定随机性的，可能有的时候觉得V1或者V2生成的更加符合自己的喜好，不过后续会提到一些动画附加组件，那些只能用于某个特定版本的运动模型上。

接下来会影响绘制效果的参数是上下文单批数量：

《（Stable Diffusion进阶篇：AnimateDiff 动画插件2）》- 投稿作者:简历白纸一张 - 发布于:GetAI社区

像是跟我在上篇笔记中一起尝试过AD的同学们应该还记得，运动模块的作用原理是一次性将多张连续的画面输入进去绘制：

《（Stable Diffusion进阶篇：AnimateDiff 动画插件2）》- 投稿作者:简历白纸一张 - 发布于:GetAI社区

这个一次性输入的画面多少就是由上下文单批数量决定的，这个会很影响最终生成的动画流畅度，因为只有同一批次生成的图片才会有最稳固的运动关联。

不过这个参数也不是越大越好，当上下文长度超过了一定的帧数时，可能会导致生成的图像背景过于单一而缺乏变化。

之所以会这样是因为AnimateDiff的运动模型是基于16帧的视频长度去训练的，因此这个上下文单批数量最好不要超过16帧。

当然显存也会影响到这一点，同时画多张图需要占用更高的显存，如果觉得电脑卡顿明显的话就把单批数量改为8，这样可以额外再节约1G左右的显存。

像是最上方的动图在生成了之后会有一个循环播放的感觉，这是因为有一个闭环模式Closed-loop存在。

《（Stable Diffusion进阶篇：AnimateDiff 动画插件2）》- 投稿作者:简历白纸一张 - 发布于:GetAI社区

N：不循环
R-P(Prompt Travel不强制闭环)：减少循环上下文
R+P(Prompt Travel强制闭环)：减少循环上下文
A：总是循环（动图第一帧与最后一帧一致）

这后面三个循环选项相当于越靠右边的选项循环得越绝对，也就是播放观感自然连贯。

在循环的时候右侧参数步幅和重叠都会对动画效果造成一定影响

《（Stable Diffusion进阶篇：AnimateDiff 动画插件2）》- 投稿作者:简历白纸一张 - 发布于:GetAI社区

不过在原教程中经过UP：Nenly同学的尝试之后默认数值1, -1所得到的动画运动效果是最为流畅丝滑的。

在之前的操作都是关于动画的质量，而动画的时长则是与“帧数”和“帧率”相关：

《（Stable Diffusion进阶篇：AnimateDiff 动画插件2）》- 投稿作者:简历白纸一张 - 发布于:GetAI社区

视频总秒数=总帧数/帧率

如果帧率是8，想要做一个5秒的视频就把总帧数改为40就可以了。一般在网上看到的视频帧率大多数是23帧、30帧甚至60帧较为居多，不过这里也不建议直接提高帧率。

过高的帧率设置不仅会加重显卡的绘制负担，还可能导致“闪烁”的概率增加。

不过扩展的作者给出了另一个巧妙的解决方案，就是利用一个叫做FILM(Frane Interpolation for Large Motion)的AI模型进行“插帧”

《（Stable Diffusion进阶篇：AnimateDiff 动画插件2）》- 投稿作者:简历白纸一张 - 发布于:GetAI社区

https://film-net.github.io/

这个插帧的意思就是在帧数与帧数之间填充近似的过渡内容，学习过EbSynth的同学应该不陌生。

《（Stable Diffusion进阶篇：AnimateDiff 动画插件2）》- 投稿作者:简历白纸一张 - 发布于:GetAI社区

这样填充了过渡内容之后可以让视频/动画更加平滑、流畅，这是一种在视频后期中比较常用的方式，在上篇笔记中安装过的Deforum扩展里就有这样一个选项：

《（Stable Diffusion进阶篇：AnimateDiff 动画插件2）》- 投稿作者:简历白纸一张 - 发布于:GetAI社区

在开启了之后回到AnimateDiff中，只需要开启帧插值，右侧的插值次数X就相当于基于同样的帧数在每两帧之间插入“X”帧，从而让视频变慢X倍。

《（Stable Diffusion进阶篇：AnimateDiff 动画插件2）》- 投稿作者:简历白纸一张 - 发布于:GetAI社区

如果想维持一开始的帧数和帧率计算出来的时间不变，例如72总帧数和8帧率。这个时候把插帧次数X设置为3-5可以让产出的视频更加丝滑。

设置为3就相当于让视频放慢三倍，但是与此同时上面的帧率要X3也就是8x3=24，这样出来的动画会比原来更加流畅丝滑。

《（Stable Diffusion进阶篇：AnimateDiff 动画插件2）》- 投稿作者:简历白纸一张 - 发布于:GetAI社区

这样一来就可以点击生成啦！不过这个生成的过程可能会比较久，如果是跟我一样72总帧数、24帧率、3插值次数的话。

动图太大我压缩了也没法上传，大伙可以自己在家尝试一下。

《（Stable Diffusion进阶篇：AnimateDiff 动画插件2）》- 投稿作者:简历白纸一张 - 发布于:GetAI社区

今天的内容就到这里结束啦！

这篇文章主要是可以帮助生成的视频和动画更加流畅自然一些，大家也可以针对自己的喜好和设备情况进行参数的调节。

剩余的内容就下篇笔记见啦~拜了个拜。

《（Stable Diffusion进阶篇：AnimateDiff 动画插件2）》- 投稿作者:简历白纸一张 - 发布于:GetAI社区

<lora:March7th:1.1>,ulzzang-6500-v1.1,(raw photo:1.2),((photorealistic:1.4))best quality ,masterpiece, illustration, an extremely delicate and beautiful, extremely detailed ,CG ,unity ,8k wallpaper, finely detail, best quality,extremely detailed CG unity 8k wallpaper,absurdres, incredibly absurdres, huge filesize, ultra-detailed, highres, extremely detailed,beautiful detailed girl, extremely detailed eyes and face, beautiful detailed eyes,light on face,full body,cinematic lighting,1girl,see-through,looking at viewer,outdoors,blue_eyes

Negative prompt: sketches, (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality, ((monochrome)), ((grayscale)), skin spots, acnes, skin blemishes, bad anatomy,(long hair:1.4),DeepNegative,(fat:1.2),facing away, looking away,tilted head, lowres,bad anatomy,bad hands, text, error, missing fingers,extra digit, fewer digits, cropped, worstquality, low quality, normal quality,jpegartifacts,signature, watermark, username,blurry,bad feet,cropped,poorly drawn hands,poorly drawn face,mutation,deformed,worst quality,low quality,normal quality,jpeg artifacts,signature,watermark,extra fingers,fewer digits,extra limbs,extra arms,extra legs,malformed limbs,fused fingers,too many fingers,long neck,cross-eyed,mutated hands,polar lowres,bad body,bad proportions,gross proportions,text,error,missing fingers,missing arms,missing legs,extra digit, extra arms, extra leg, extra foot,holding, holding_camera

Steps: 30
Sampler: Euler a
CFG scale: 7
Seed: 3878725014
Size: 512x512
Model hash: e4a30e4607
Model: majicmixRealistic_v6
Denoising strength: 0.7
Clip skip: 2
ENSD: 31337
Hires upscale: 2
Hires upscaler: R-ESRGAN 4x+
Lora hashes: “March7th: ed83eddc60bc”
Pad conds: True
Version: v1.7.0

部分参考素材来源：

原教材链接：

https://www.bilibili.com/video/BV1zS421A7PG/?spm_id_from=333.1007.top_right_bar_window_history.content.click